En la carpeta data se encuentran 10 archivos .log de los 10 cuadrantes llamados clipped_total_<lat>W_<lon>N.log. Los datos se encuentran en orde ascendente, comenzando con el trimestre 2 del año 1984 y finalizando con el trimestre 3 del año 2015. Estos archivos contienen 3 columnas con el número de pixeles de cada una de las tres clases en el cuadrante para todos los trimestres de la serie.
El orden de las columnas es el siguiente:
1a columna: no_data
2a columna: no agua
3a columna: agua
Al cargarlos se ven de la siguiente forma:
head(src)
## c0 c1 c2
## 1 835835175 0 0
## 2 817741430 17166404 927341
## 3 604900662 222364239 8570274
## 4 725781449 106142137 3911589
## 5 816948769 18883727 2679
## 6 727019303 105153177 3662695
A partir de estos datos se agregaron columnas de años, mes del inicio de trimestre, cuadrante o zona, y se determinó el porcentaje de falta de datos para cada cuadrante y cada trimestre, lo cual está en la columna pct_c0. Sin embargo este porcentaje incluye la falta de datos de los cuadrantes en zonas donde no deberÃa haber datos, como en el mar o fuera de México, por lo que también se calcularon porcentajes de falta de datos tomando como 100% de datos, el número de pixeles máximo para cada cuadrante de agua y no agua. Este porcentaje es el de la columna pct_c0_rel_data y es el que se tomó para explorar los datos.
A continuación se muestran los primeros renglones de la tabla de datos con estos porcentajes:
head(df)
## c0 c1 c2 year month zone pct_c0
## 1 835835175 0 0 1984 04 c100w20n 100.00000
## 2 817741430 17166404 927341 1984 07 c100w20n 97.83525
## 3 604900662 222364239 8570274 1984 10 c100w20n 72.37081
## 4 725781449 106142137 3911589 1985 01 c100w20n 86.83308
## 5 816948769 18883727 2679 1985 04 c100w20n 97.74042
## 6 727019303 105153177 3662695 1985 07 c100w20n 86.98118
## pct_c0_rel_data
## 1 100.00000
## 2 95.91723
## 3 47.89072
## 4 75.16690
## 5 95.73837
## 6 75.44622
A continuación se muestran gráficas de los 10 cuadrantes, las cuales muestran cuatro subgráficas, una para cada trimestre, donde se muestra el porcentaje relativo de falta de datos a lo largo del tiempo:
En la siguiente gráfica se muestran las mismas gráficas, pero todos los cuadrantes juntos:
A continuación se muestra un boxplot para cada cuadrante ordenado de acuerdo al porcentaje relativo:
A continuación se muestran 10 gráficas, una por cuadrante, con subgráficas de cada año, donde se muestra el porcentaje relativo de no data para cada trimestre:
A continuación se muestran las mismas gráficas anteriores, pero todos los cuadrantes en una misma gráfica: